یکپارچه سازی محتواهای مرکز، نقش مهمی در تولید دانش دارد
اشاره
در سالهای گذشته، تولید محتوا و عرضه آن به کاربران، یکی از مؤلّفههای مطرح در حوزه فنّاوری اطّلاعات به شمار میرفت؛ امّا امروزه یکپارچهسازی دادهها به همراه تعامل با کاربران و استفادهکنندگان محصولات نرمافزاری، از اهمّیّت بسیار بالایی برخوردار است. نظر به اهمّیّت مباحث فنّی و هوش مصنوعی در مرکز تحقیقات کامپیوتری علوم اسلامی، با معاون محترم فنّی مرکز نور، جناب آقای مهندس، مهدی نیکنام، گفتوگو نمودیم.
در این مصاحبه، به مباحث و محورهایی همچون: جایگاه معاونت فنّی، بخش ادارهها و وظایف کلّی، بسترهای تولید نرمافزار در مرکز، یکپارچهسازی اطّلاعات (گراف دانش)، تعامل با مراکز علمی و مؤسسات پژوهشی دیگر، دادهمحوری و ارزیابی رفتار کاربران، خواهیم پرداخت. امید است که مورد توجّه و استفاده علاقهمندان قرار گیرد.
روش های استخراج خودکار دانش از متون حدیثی
اشاره
حدیث، از منابع متنی مهم در استنباط آموزه های شرعی، عقیدتی و اخلاقی در اسلام است. فزونی منابع حدیثی و ضرورت استفاده از آن در شناخت احکام اسلام، استفاده از فنون خودکار استخراج دانش از متون حدیثی را ضرورت می بخشد. خصوصیات زبانی ویژه متون حدیثی (زبان عربی قدیم و متون روایتگونه)، مستلزم گردآوری و بهره گیری از شیوه های خاص پردازش زبان طبیعی شده است که در متون و زبانهای دیگر استفاده از چنین پردازشهای خاص نبوده است. در این مقاله، نخست استخراج خودکار دانش بر پایه فنون متن کاوی بیان، و پژوهشهای انجام شده برای استفاده از این شیوه ها در استخراج دانش از متون حدیثی، بررسی می شود.
داده های بزرگ؛ ویژگی ها و کاربردها
اشاره
در این مقاله، بهترین دستاوردهای داده های بزرگ را مورد بررسی قرار داده و سپس، مصارف عمومی داده های بزرگ را معرفی کرده، فناوری های مربوطه را بررسی می نماییم؛ مانند: محاسبات ابری، اینترنت اشیاء، مراکز داده ای و هادوپ. آنگاه بر چهار فاز زنجیره ارزشی داده های بزرگ تمرکز می کنیم؛ همچون: تولید داده، اکتساب داده، ذخیره داده و تحلیل داده. پس از این، چالش های فنی را در این زمینه مورد بحث قرار داده، آخرین پیشرفت ها را بررسی کرده در نهایت نیز به چندین نمونه از برنامه های کاربردی داده های بزرگ اشاره می نماییم؛ از جمله، مدیریت تجاری، اینترنت اشیاء، شبکه های اجتماعی آنلاین که همگی می توانند در مباحث علوم انسانی و اسلامی مورد استفاده قرار گیرند و یا دست مایه پژوهش برای دست اندرکاران مهندسان و متخصصان این حوزه قرار گیرد.
استخراج مفهوم در داده کاوی
مقدمه
استفاده از رایانه در امور مختلف، باعث شده تا داده های بسیاری با سرعت های زیاد در پایگاه داده ها انباشته و ذخیره شوند. پردازش این داده های حجیم، خارج از توان انسان است. تلاش های فراوانی تاکنون انجام شده است تا نرم افزارها و سخت افزارها توسعه پیدا کنند و تولید، ذخیره و انتقال داده ها انجام گردد؛ اما تجزیه و تحلیل این حجم از داده ها توسط رایانه ها، بعد از ذخیره و پردازش، تاکنون انجام نشده است. داده ها در عصر حاضر، قلب تپنده هر سازمان را تشکیل می دهند و هر روز به میزان داده ها در سیستم های اطلاعاتی افزوده می شود. در واقع، سازمان ها در اطلاعات غرق شده اند؛ درحالی که تشنه دانش هستند. این امر، نشانگر آن است که سازمان ها نتوانسته اند از دانش درون داده ها به نحو مناسب استفاده نمایند. در درون حجم عظیمی از داده ها، الگوها و روابط بسیاری میان پارامترهای مختلف به صورت پنهان باقی می ماند که برای برنامه ریزی های استراتژیک و طولانی مدت می تواند حیاتی باشد. بنابراین، نیاز به ابزاری است تا داده ها را به گونه ای پردازش کند تا دانش حاصل از آن را در اختیار تصمیم گیران سازمان قرار دهد. یکی از راهکارهایی که امروزه در این زمینه ایجاد و در حال گسترش است، داده کاوی(1) است. داده کاوی، فرآیند کشف دانش پنهان درون داده هاست که با توصیف، تشریح، پیش بینی و کنترل پدیده های گوناگون پیرامونی، دارای کاربرد بسیار وسیعی در حوزه های مختلف است؛ به گونه ای که مرز و محدودیتی برای کاربرد آن در نظر گرفته نشده و زمینه های کاربردی آن را از ذرات کف اقیانوس تا اعماق فضاء می دانند (شهرابی، 1386).
شبکه واژگانی زبان عربی با استفاده از فرآیند نیمه خودکار در داده های علوم اسلامی
چکیده
غنی سازی محتواهای علوم انسانی و اسلامی، از اهمیت ویژه ای برخوردار است. استفاده از شبکه واژگانی، از مهم ترین راهبردهای تحقیقاتی در رشته های مرتبط با علوم انسانی است. شبکه واژگانی، مجموعه ای از کلمات است که به واسطه ارتباطات معنایی به یکدیگر متصل شده و در سطحی جامع تر از یک لغت نامه در یادگیری یا استخراج اطلاعات مورد نیاز محققان کاربرد دارد. روند فعالیت در دستیابی خودکار به یک شبکه واژگانی منسجم، در گرو پردازش لفظی و پردازش معنایی بر اساس متن کاوی داده های عربی در منابع زبانی دقیق و مناسب است. استفاده از فرآیند ماشینی در هر یک از این مراحل پردازش و یافتن منابع عربی دقیق علوم اسلامی، با چالش های مختلفی رو به رو بوده که در این مقاله، به بررسی برخی جزئیات این طرح، به ویژه بر اساس دادگان موجود در مرکز تحقیقات کامپیوتری علوم اسلامی و روش مقابله با چالش ها پرداخته شده است.
ابهام زدایی هوشمند صرفی نور
چکیده
یکی از چالش های پیش روی پردازش زبان طبیعی زبان عربی، رفع ابهام میان تحلیل های صرفی ممکن یک کلمه به تناسب جایگاه آن کلمه در جمله است. یک تحلیلگر صرفی، به ازای هر کلمه ورودی، ممکن است بیشتر از یک جواب صرفی داشته باشد. تشخیص اینکه کدام یک از تحلیل های ممکن، تحلیل صحیح کلمه مورد نظر است، توسط ابزارهای رفع ابهام صورت می گیرد. این مقاله، به یکی از قوی ترین ابزارهای رفع ابهام اشاره می کند که به صورت خاص، برای تحلیلگر صرفی نور (Noor Morphological Analyzer) طراحی شده است. این ابزار که ابهام زدای صرفی نور (Noor Morphological Disambiguation) نامیده شده، ترکیبی از الگوریتم های یادگیری و قاعده محور است. آزمایش های این تحقیق نشان می دهد که رفع ابهام صرفی نور می تواند با دقت 88 درصد خروجی های تحلیلگر صرفی نور را رفع ابهام نماید.
شناسایی خودکار سیر اشتقاق کلمات در زبان عربی
چکیده
به دست آوردن سیر اشتقاق تصریف از ریشه تا کلمه، پیداکردن کلمات مرتبط و در نهایت، تشکیل خانواده کلمات مربوط به هم، شرایط مساعدی را برای محققان پردازش زبان طبیعی فراهم می کند تا بتوانند از مرحله لفظ به دامنه وسیع لغات هم معنا، آنتولوژی، شبکه معنایی، تحلیل محتوا و در نهایت، درک معنا قدم بگذارند. در این بین، ساخت درخت سلسله مراتبی کلمات مرتبط با هم از ریشه(صرفی) تا برگ(کلمات متن)، اهمیت بسزایی دارد. در این مقاله، به چندین فایده از فواید «تحلیلگر صرفی نور» اشاره شده است. بعضی از این موارد، عملیاتی شده و هم اکنون در حال استفاده هستند و بعضی دیگر نیز نزدیک به اجرا می باشند. از جمله این موارد، بهره برداری در شناسایی خودکار سیر اشتقاق تصریف و تشکیل درخت سلسله مراتبی می باشد. عناصر داخل این درخت، همگی توسط تحلیلگر صرفی نور تولید می گردند. بعد از آن، عملیات دسته بندی و در نهایت ایجاد درخت مذکور صورت می پذیرد. تمام مسیرهای موجود از برگ ها تا ریشه، موضوعیت دارند که در این نوشتار به چند فایده از آن اشاره شده است.
داده پردازی فقه شیعه، نیاز ها و چالش ها
گنجینه میراث فقهی تشیع، با گذشت قرون و اعصار گسترده شد و منابع و کتب فقهی بی شماری به نگارش در آمد. فقهاء در طول زمان، به رغم رویارویی با شرایط دشوار و مشکلاتی که گریبانگیرشان بوده، از تدوین اندیشه ها و آراء خود دست بر نداشته و آثار سرشار از مباحث نفیس و ارزشمند فقهی را فراهم آورده اند. اما میراث گذشتگان هر چند فاخر و غنی باشد، به تنهایی برای ماندگاری فقه کافی نیست. نیازهای روزافزون انسان ها، مسائل نوپیدا و ظهور و بروز آنها در گردونه زندگی، ضرورت دگرگونی در ساحت فقاهت را بیش از هر زمانی در کانون توجه قرار داده است.
کاربرد متن کاوی در سازمان دهی دانش
چکیده
سازمان دهی دانش و متن کاوی، در بازیابی دقیق اطلاعات کاربرد بسیاری دارند. از این رو، متن کاوی می تواند کارکردهای بسیاری در بهبود سازمان دهی دانش داشته باشد. اگرچه متن کاوی، به ویژه در بخش یادگیری ماشینی و به دست آوردن اسناد و نمونه های آموزشی، نیازمند نظام های اصطلاح نامه، طبقه بندی، فهرست نویسی و نمایه سازی است، سازمان دهی برای تسریع کار خود، نیازمند فنون متن کاوی و نتیجه کارهای آن خواهد بود تا هم سرعت کار خویش را افزایش دهد و هم هزینه هایش را بکاهد. در این نوشتار، به کارکردهای متن کاوی در حوزه سازمان دهی دانش پرداخته خواهد شد.
تعریفها و اصطلاحها(آشنایی با اصطلاحهای پرکاربرد در سازماندهی دانش)
چکیده
هر حوزهای از دانش، اصطلاحها و عبارتهایی دارد که دارای تعاریف و معانی ویژه است و متخصصان آن حوزه برای آنها در نظر گرفتهاند. ممکن است هر یک از این اصطلاحها در دیگر رشتههای علوم، یا حتی در زیررشتههای دیگر یک علم، معانی و تعاریف دیگری داشته باشند. در حوزه سازماندهی اطلاعات که از مباحث مطرح در علم کتابداری و اطلاعات است، اصطلاحهایی خاص مطرح است که در ذیل به برخی از رایجترین آنها پرداخته خواهد شد.